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为 什么 和 


诱发 音乐 情感 ? 
一 一 音乐 协和 性 的 作用 及 其 认 知 机 制 


张 航 ' k p REZ? 
(中 国人 民 大 学 心理 学 系 , 北京 110872) @ 广西 师范 大 学 教育 学 部 , 桂林 541004) 
H 要 音乐 是 高 级 意识 活动 产生 的 声音 艺术 ,对 人 类 的 情感 表达 和 交流 具有 重要 意义 。 作 为 连接 音乐 与 情 


绪 的 核心 要 素 , 协和 性 的 形成 原理 至 今 仍然 未 有 定论 。 人 类 如 何 加 工 多 个 音符 构成 的 和 声 ? 为 什么 一 些 和 上 声 
听 起 来 协和 (愉悦 )， 一 些 和 声 听 起 来 不 协和 (不 愉悦 )? 协和 感 究竟 是 自 下 而 上 的 声学 感知 还 是 自 上 而 下 的 审 
美体 验 ? 从 十 希腊 时 代 至 今 ， 这 些 问题 就 一 直 吸引 着 学 者 的 目光 。 物 理学 家 从 协和 与 不 协和 的 声学 区 别 中 寻 
找 答 案 ， 生 理学 家 从 听觉 生理 机 制 方面 分 析 协 和 感 的 产生 ， 心 理学 家 研究 协和 音程 偏好 是 与 生 俱 来 的 还 是 后 
天 形成 的 。 目 前 ， 音 乐 协和 性 的 理论 内 容 主 要 以 西方 音乐 为 主 , 中 国 传 统 民族 音乐 迫切 需要 开展 相关 的 实证 研究 。 
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1 引言 
音乐 是 经 由 人 类 意识 活动 产生 的 声音 组 合 的 
高 级 艺术 ， 只 有 对 声音 的 频率 和 节奏 等 信息 进行 


意识 编排 才能 够 创造 出 优美 的 旋律 。 因 此 ， 
作 、 演 奏 或 聆听 音乐 是 人 类 具有 复杂 声音 事件 处 
理 能 力 的 重要 标志 。 作 为 人 类 的 特有 才能 ,音乐 
活动 贯穿 人 类 文明 史 的 始终 。 考 古 学 证 据 显 示 ， 
人 类 至 少 在 35000 年 前 的 旧 石 器 时 代 就 能 够 制作 
并 且 使 用 乐器 (Conard et al., 2009; Killin, 2018)。 

作为 人 类 的 通用 语言 , 音乐 存在 于 所 有 的 文明 社 
会 (有 文字 的 或 无 文字 的 ) 中 (Mehr et al., 2019)。 作 
为 情感 交流 的 艺术 载体 ， 音乐 伴随 着 人 的 一 生 ， 
从 摇篮 曲 到 葬礼 嘉 乐 ,都 是 人 类 释放 情感 和 引发 
共鸣 的 重要 方式 (Belfi et al., 2021)。 音乐 对 人 类 的 
非凡 意义 使 得 许多 学 科 都 重视 对 音乐 基础 理论 的 
人 研究 。Science 在 创刊 125 周年 之 际 ， 就 将 音乐 和 
语言 的 起 源 列 为 125 个 最 具 挑 战 性 的 科学 问题 之 
— (Kennedy & Norman, 2005), Nature 也 以 “科学 与 
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音乐 ”为 专题 , 探讨 音乐 理论 与 实践 中 吸 待 解决 的 
重要 问题 ,包括 现代 和 声音 乐 学 的 理论 核心 
音乐 的 协和 性 (musical consonance) (Ball, 2008)。 
协和 性 是 音乐 构建 的 基本 要 素 。 无 论 何 种 音 
乐 形式 或 题材 ， 都 由 音符 组 成 ,音符 同时 发 声 
成 和 声 (harmony)， 相 继 发 声 构 成 旋律 (melody)。 
音乐 协和 性 是 两 个 或 两 个 以 上 音符 同时 演奏 时 所 
引发 的 心理 感受 (McDermott et al., 2016; Parncutt 
& Hair, 2011; Zentner & Kagan, 1996)。 根 据 演奏 
效果 , 可 以 将 和 声 分 为 两 类 ， 听 起 来 愉悦 、 稳 定 或 
彼此 融合 的 和 声称 作协 和 音程 (Consonant interval) 
ak Dh A ASX (consonant chord)， 听 起 来 不 愉悦 、 不 
稳定 或 彼此 不 融合 的 和 声称 作 不 协和 音程 (dissonant 
interval) BAS Ph Al Fl 5X (dissonant chord) (Harrison 
& Pearce, 2020; McDermott et al., 2016). 迄今 为 止 ， 
已 经 有 大 量 的 理论 试图 说 明 音 乐 中 存在 协和 与 不 
协和 两 种 音响 效果 的 原因 ， 但 都 存在 着 较 大 的 争 
议 。 这 些 理 论 可 以 归纳 为 三 种 ( 见 表 1): (1) 强 调 音 
乐 刺激 的 物理 属性 ， 认 为 和 声音 程 的 声学 特征 是 
影响 音乐 协和 性 的 主要 因素 ， 主 张 总 结 出 人 类 普 
人 遍 遵循 的 数理 规律 ，(2) 侧 重 于 考察 音乐 加 工 的 生 
理 属性 和 心理 属性 ,认为 音乐 协和 感 是 声音 事件 
在 听觉 通道 诱发 的 情绪 体验 ,主张 采用 生理 声学 
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R1 音乐 协和 性 的 相关 理论 


假设 观点 


影响 因素 基本 理论 


相关 文献 


规律 整体 听 起 来 越 协和 


生物 决定 论 ”音符 之 间 的 数理 “同时 响起 的 音符 之 间 音 高 之 比 越 简单 ,声音 Crocker, 1963; Palisca, 1961 


泛音 列 的 和 谐 性 


音乐 协和 性 是 基于 纵向 县 置 的 声学 特征 


Bowling et al., 2018; Gill & Purves, 2009; 


& 


多 大 程度 上 近似 一 个 和 谐 的 


然 泛 音 列 McDermott et al., 2010 


人 耳 的 生理 机 制 A A RZ AS 
S, 导致 频率 过 于 接近 的 泛音 列 之 间 会 在 


E 差 ,频谱 分 布 不 


Greenwood, 1961; Helmholtz, 1885; 
Shapira & Stone, 2008; Plomp & Levelt, 


REN 


1965 
底 膜 引起 拍 频 效 应 ， 从 而 引发 不 愉悦 的 粗糙 
感 体验 
比较 心理 学 (动物 ”音乐 协和 性 偏好 受到 听觉 加 工 系统 约束 , 具 Fishman et al., 2001; Hoeschele et al., 
行为 研究 ) 有 重要 的 生物 学 意义 2012; Izumi, 2000; McKinney et al., 2001 


认 知 神经 机 制 皮层 和 皮层 下 水 平 的 神经 通路 对 和 谐 泛 音 ，Bidelman，2013; Bidelman & Krishnan, 


特征 存在 编码 优势 。 


下 


Se 


E 生 发 展 (先天 ) ”音乐 协和 性 偏好 是 与 生 俱 来 的 知觉 能 力 


2009; Itoh et al., 2010; Gold et al., 2019 


Virtala et al., 2013; Zentner & Kagan, 


1996 
环境 决定 论 ”毕生 发 展 (后 天 ) ”音乐 协和 性 是 后 天 习 得 的 音乐 审美 经 验 Plantinga & Trehub, 2014; Weiss et al., 
2020 
文化 因素 音乐 协和 性 知觉 存在 文化 差异 Ambrazevičius, 2017; McDermott et al., 
2016 
音乐 训练 音乐 训练 对 音乐 协和 性 知觉 具有 重要 的 逆 Foss et al., 2007; Minati et al., 2009 
造作 用 
交互 作用 论 ”多 因素 混合 理论 。 泛音 和 谐 性 、 拍 频 效应 和 文化 明 陶 共同 影响 Harrison & Pearce, 2020; Parncutt & 
音乐 协和 性 知觉 Hair, 2011 
实验 和 心理 声学 实验 揭示 出 这 种 普遍 的 听觉 加 工 期 。 毕 达 哥 拉 斯 是 第 一 个 触及 该 领域 的 学 者 。 他 


机 制 。 这 两 种 理论 不 约 而 同 地 认为 ， 音 乐 协和 性 
的 感知 能 力 是 人 类 与 生 俱 来 的 天 赋 才 能 。(3) 聚 焦 
音乐 的 文化 属性 ， 认 为 音乐 协和 性 知觉 是 后 天 形 
成 的 审美 经 验 ， 受 文化 票 陶 和 音乐 训练 影响 。 本 
文 以 上 述 三 种 理论 为 脉 略 ,介绍 不 同学 科 的 成 果 ， 
阐明 人 类 音乐 协和 感 的 形成 原理 和 认 知 机 制 , 为 
未 来 的 相关 研究 尤其 是 中 国民 族 音乐 协和 性 的 理 
论 研究 提供 启示 。 


2 音乐 协和 性 的 数理 之 美 


音乐 是 一 门 艺 术 , 但 当 人 们 研究 其 原理 、 分 
析 其 性 质 、 发 现 其 规则 时 ， 就 成 为 一 门 科 学 。 
乐 协 和 性 理论 的 发 展 正 是 基于 对 音乐 美学 的 不 懈 
追求 , 这 从 根本 上 推动 了 人 类 使 用 理性 的 目光 审 
视 其 背后 的 奥秘 , 探测 隐藏 于 音符 间 微 妙 的 数理 
关系 。 从 数理 角度 探讨 音乐 协和 性 的 理论 主要 包 
括 简单 整数 比 学 说 (Small-Integer Ratios Theory) 和 
泛音 和 谐 理 论 (Harmonicity Theory)。 
2.1 简单 整数 比 学 说 

音乐 协和 性 的 早期 研究 可 以 追溯 至 古 希 腊 时 


mk 


发 现 ， 同 时 拨 动 的 两 条 琴 弦 长 度 之 比 越 简单 ， 和 
声效 果 越 协和 ， 弱 长 之 比 越 复杂 ， 和 声效 果 越 不 
协和 (Crocker, 1963; Purves, 2017)。 据 此 ， 把 弦 长 
关系 1: 2 ( 纯 八 度 )、2: 3 ( 纯 五 度 ) 和 3: 4 ( 纯 四 度 ) 
的 音响 组 合 划 定 为 协和 一 致 的 愉悦 音程 ,并 从 和 
谐 哲学 观念 赋予 这 些 数值 以 特殊 象征 含义 一 一 
“ 圣 十 结构 ”(Tetractys, 10 =1+2 +3 + 4)， 认 为 美 
的 事物 总 是 有 类 似 简单 且 和 谐 的 数学 特征 ， 甚 至 
将 “ 数 ” 视 为 万 物 之 源 , 宇宙 i 和 谐 本 质 上 是 “ 数 ” 的 
和 if (Bowling & Purves, 2015; Crocker, 1963; 
Primavesi，2016)。 简 单 整数 比 学 说 提出 促进 了 音 
乐 协和 性 的 数理 规律 研究 。 尤 其 是 在 文艺 复兴 时 
期 ,大 量 作曲 家 在 简单 整数 比 思想 指导 下 探索 协 
和 性 的 规律 ， 以 丰富 协和 音程 与 和 弦 的 数量 。 意 
大 利 作曲 家 扎 利 诺 用 “六 数列 ”来 说 明 协 和 性 的 产 
生 原 则 (6 = 1+2+3=1x2x3), 认为 所 有 的 协 
和 音程 都 由 1 到 6 几 个 数字 组 成 (Bowling & Purves, 
2015; Palisca, 1961; Sukljan, 2020)， 从 而 把 原来 一 
直 被 毕 氏 学 派 看 作 是 不 协和 音程 的 6: 5 (小 三 度 )、 
5:4 (大 三 度 ) 和 5: 3 (大 六 度 ) 调 整 至 协和 音程 范畴 ， 
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为 推动 和 声音 程 系统 分 类 做 出 重要 贡献 (Tenney， 
1988)。 至 此 ， 现 代 和 声音 乐 学 中 协和 音程 和 不 协 
和 音程 基本 确立 。 

音乐 形式 的 易 故 革新 和 音乐 种 类 的 丰富 多 彩 
表明 , 音乐 极 具 有 社会 历史 性 和 文化 多 样 性 。 但 
是 , 通过 比较 不 同时 期 其 至 是 不 同 地 区 的 研究 发 
现 ， 人 对 音程 协和 性 的 感知 偏好 存在 着 极 高 的 相 
似 性 (图 1a)， 且 极度 符合 简单 整数 比 学 说 ， 听 众 
普遍 地 将 比值 简单 的 音符 组 合 评定 为 协和 音程 ， 
将 比值 复杂 的 音符 组 合 评定 为 不 协和 音程 。 这 说 
明 , 数理 思想 对 解释 协和 性 仍然 具有 和 较 强 的 现实 
意义 。 即 便 在 今天 , 没有 一 种 理论 能 够 像 简单 整 
数 比 说 那样 对 音乐 艺术 产生 如 此 大 的 影响 。 由 此 
也 引发 一 个 关键 性 的 疑问 , 为 什么 比值 简单 的 和 
声 听 起 来 协和 ? 
2.2 ”泛音 和 谐 理 论 

声音 科学 的 诞生 为 解答 和 声 协 和 性 提供 了 新 
的 思考 方式 。 首 先 , 声音 是 一 种 机 械 振动 ， 振 动 频 
率 决 定 音 高 ， 所 以 ， 影响 音乐 协和 性 的 本 质 因 素 
是 弱 振 动 频率 比 而 非 弦 长 比 Konoval, 2018)。 其 次 ， 
泛音 (overtones) 作 为 最 基本 的 声学 现象 是 音乐 协 
和 性 形成 的 物理 基础 (Pesic, 2014)。 因 为 传统 乐器 


不 协和 音程 协和 音程 


或 人 发 出 的 声音 都 是 复合 音 ， 除 了 能 够 听 到 一 个 
响亮 的 基 音 音 高 外 ， 还 能 够 听 到 一 系列 相对 和 柔弱 
却 悦 耳 协 和 的 “ 弦 外 之 音 ”(Dostrovsky，1975; 
Konoval,，2018)。 以 理想 的 弦 振 动 为 例 (图 lb)， 被 
拨 动 的 琴 弦 同时 做 整 段 振 动 和 局 部 振动 (二 分 之 
一 、 三 分 之 一 、 四 分 之 一 …)， 整 段 振动 产生 清楚 
啊 亮 的 基 音 (fundamental tone), 分 段 振动 产生 了 
一 系列 整数 倍 于 基 音 频率 (简称 基 频 ，frequency 
fundamental) 的 泛音 。 泛音 现象 发 现 为 数学 和 音乐 
学 之 间 搭 建 了 桥梁 , 包括 拉 莫 在 内 的 许多 音乐 学 
家 主张 运用 声学 理论 而 非 纯粹 数学 来 研究 音乐 协 
和 性 。 拉 英 认 为 , 在 自然 泛音 (natural harmonics) 
中 包含 许多 协和 音程 ， 构 成 协和 音程 的 泛音 列 与 

音 距 离 更 近 ， 听 起 来 更 清晰 ,构成 不 协和 音程 
的 泛音 列 距离 基 音 较 远 , 不 容易 被 察觉 (Christensen,， 
2004; Kieffer, 2016)， 如 表 2 fia, BA RoE 
几 个 泛音 无 论 是 与 基 音 的 音程 关系 还 是 与 前 一 个 
泛音 的 音程 关系 都 非常 协和 ， 表 明和 谐 的 泛音 列 
本 身 就 是 一 个 协和 和 和弦 (chord)。 所 以 ,简单 整数 
比 的 音乐 审美 倾向 在 一 定 程 度 上 反映 了 人 类 对 自 
然 和 谐 泛 音 的 知觉 偏好 ， 当 两 个 音 被 同时 演奏 时 ， 
其 县 加 形成 的 声学 特征 在 泛音 关系 上 越 和 谐 ， 构 
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图 1 a. M 1898 年 至 2020 年 间 , 来 自 6 个 国家 受 试 者 对 12 个 和 声音 程 音乐 协和 性 的 等 级 排列 结果 高 度 一 致 。 数 据 
分 别 选 自 : 美国 (Guernsey，1928)， 日 本 (Butler & Daston，1968), 德国 (Stumpf，1898), 英国 (Pear，1911), 新 加 坡 
(Bowling & Purves, 2015)， 加 拿 大 (Weiss et al., 2020)。b. 吉他 琴 弱 振动 产生 的 泛音 列 。c. 协和 音程 ( 纯 五 度 ) 和 不 协 
和 音程 (三 全 音 ) 的 频谱 示意 图 。 绿 色 实 线 代 表 根 音 音符 A 的 频率 成 分 基 频 是 110 Hz, 泛音 是 220, 330, 440, 550, 


660 Hz 等 。 三 全 音 中 红色 虚线 代表 冠 音 音符 Eb， 基 频 是 156 Hz, 泛音 是 312, 468, 624, 780, 936 Hz 等 。 纯 五 度 中 红 
色 虚 线 代表 冠 音 音符 E， 基 频 是 165 Hz, 泛音 列 是 330, 495, 660, 852 Hz 等 。 黑色 虚线 代表 纯 五 度 的 虚拟 音 高 。d. 基 


底 膜 上 拍 频 效 应 的 示意 图 。 拍 频 效 应 通常 由 泛音 列 过 于 接近 的 不 协和 音程 引发 。 
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表 2 自然 倍 音 列 中 基 音 与 泛音 之 间 的 协和 关系 


名 称 与 基 音 的 关系 与 基 音 的 音程 关系 协和 性 与 前 一 泛音 的 关系 ”音程 名 称 协和 性 
ay 1:1 纯 一 度 C 1:1 纯 一 度 C 
第 一 泛音 2:1 纯 八 度 C 2:1 ali C 
第 二 泛音 3:1 纯 八 度 + 纯 五 度 C 3:2 纯 五 度 C 
第 三 泛音 4:1 纯 八 度 + 纯 八 度 C 4:3 纯 四 度 C 
第 四 泛音 5:1 纯 八 度 + 纯 八 度 + 大 三 度 C 5:4 大 三 度 C 
第 五 泛音 6:1 纯 八 度 + 纯 八 度 + 纯 五 度 C 6:5 小 三 度 C 
第 六 泛音 7:1 纯 八 度 + 纯 八 度 + 小 七 度 D 7:6 无 该 音程 nee 
第 七 泛音 8:1 纯 八 度 + 纯 八 度 + 纯 八 度 C 8:7 无 该 音程 ee 
第 八 泛音 9:1 三 个 纯 八 度 + 大 二 度 D 9:8 大 二 度 D 
第 十 五 泛音 16:1 UP ei IE C 16:15 小 二 度 D 

TE: C 代表 协和 英文 缩写 “consonance”, D 代表 不 协和 英文 缩写 “dissonance”. 


成 的 声音 织 体 就 越 协 和 。 

人 类 对 和 谐 泛音 的 偏好 可 能 是 一 种 适应 性 的 
加 工 机 制 , 并 且 有 重要 的 进化 意义 。 因 为 人 类 的 
嗓音 、 大 多 数 动物 的 叫 声 以 及 物体 的 有 规则 振动 
都 产生 与 基 音 基 售 频 关系 的 和 谐 泛音 特征 (嗓音 
称 共振 峰 , formants)， 这 些 声 音 也 是 社交 、 择 偶 或 
生存 警示 意义 的 凸显 性 信号 (Bowling et al., 2017)。 
所 以 , 在 自然 选择 压力 下 ， 人 类 进化 出 了 一 套 可 
以 解析 和 谐 泛 音 的 听觉 系统 ,能 够 在 纷繁 无 序 的 
声音 世界 中 迅速 地 分 辨 泛音 有 序 的 重要 信息 。 研 
究 发 现 ,嗓音 作为 生物 学 意义 极 高 的 听觉 刺激 是 
有 效 地 预测 音乐 协和 性 的 指标 ,那些 与 嗓音 频谱 
桂 征 相似 的 和 弦 听 起 来 更 协和 (Bowling et al., 
2018; Gill & Purves, 2009)， 说 明 相 较 于 泛音 无 序 
的 噪音 ， 人 类 大 脑 更 容易 处 理 嗓 音 般 的 和 谐 声 响 
进而 引发 积极 的 情绪 体验 。 嗓音 被 喻 为 人 类 的 “ 听 
觉 面孔 ”， 闻 声 数 秒 ， 就 能 够 迅速 地 获取 对 方 的 性 
别 、 身 份 、 情 绪 、 吸 引力 甚至 是 体型 大 小 等 信息 
(Pisanski & Feinberg, 2019)。 对 嗓音 相似 特征 的 加 
工 优势 (processing advantage) 是 人 脑 的 预 装机 制 
(Bowling & Purves, 2015; Harrison & Pearce, 
2020). 不仅 如 此 , Schwartz 等 人 (2003) 对 上 千 段 语 
音 材料 进行 特征 提取 后 发 现 ， 人 类 言语 信息 的 振 
局 一 频率 分 布 模式 恰好 对 应 于 音程 协和 度 的 等 级 
质 序 ， 表 明 人 类 在 言语 特征 上 的 统计 知觉 经 验 训 
练 了 人 耳 对 特定 频率 比 的 音程 协和 感 。 和 谐 泛音 
偏好 也 可 能 发 镍 于 人 类 对 于 大 自然 和 谐音 响 法 则 
的 崇尚 与 追求 。 例 如 ,大 三 和 弦 产 生 就 是 源 于 对 
自然 泛音 的 观察 (Christensen，2004)， 西 方 五 度 相 


= 


生 律 和 中 国 三 分 损益 律 的 建立 也 受 自然 泛音 的 启 
Be, 甚至 最 初 的 音乐 形式 就 是 人 类 对 大 自然 声音 
律动 的 倾听 和 模仿 ( 王 小 盾 ，2017)。《 淮 南 子 》 中 
有 :“ 乐 生 于 音 , PETE, PEFR, WEZE 
也 。” 大 自然 的 风 吟 雨 落 、 鸟 叫 虫 鸣 极 可 能 是 人 类 
形成 和 谐音 响 审美 法 则 的 最 初 灵 感 来 源 。 

但 是 ， 持 信息 加 工 观 点 的 研究 者 却 认为 ， 泛 
音 作为 物理 特征 所 以 引发 协和 性 的 情绪 体验 主要 
与 音 高 的 表征 机 制 有 关 (McLachlan et al., 2013)。 
音 高 是 乐音 (物体 有 规则 振动 产生 ) 的 基本 听觉 属 
性 ， 对 音 高 的 感知 是 理解 音乐 和 语言 的 重要 媒介 
(Norman-Haignere et al., 2019)。 通常 说 来 ， 音 高 由 
基 音 决定 , 但 多 声 源 复 合 信号 的 音 高 知觉 就 变 得 
复杂 并 受 泛音 信息 影响 (Harrison & Pearce, 2020; 
Oxenham, 2018; Popham et al., 2018)。 星 倍 频 关系 
的 基 音 和 泛音 被 自动 地 知觉 为 来 自 同 一 声 源 ， 基 
音 决 定 音 高 ,泛音 影响 音色 , 但 不 具 和 谐 关系 的 
声音 由 于 无 法 被 听觉 系统 有 效 地 分 辨 , 会 造成 知 
觉 不 流畅 的 不 愉悦 体验 。 研 究 证 实 ， 听 者 对 协和 
音程 与 不 协和 音程 的 音 高 知觉 水 平 存 在 着 差异 ， 
大 脑 对 不 协和 音程 的 音 高 编码 比 协 和 音程 慢 
36ms (Tabas et al., 2019)。 在 不 协和 音程 中 完成 音 
高 匹配 的 错误 率 更 高 ， 反 应 时 更 长 ， 说 明 大 脑 并 
不 擅长 处 理 泛音 不 和 谐 的 声音 (Seror & Neill, 
2015)。 甚 至 在 不 协和 音乐 背景 中 进行 Stroop 任务 
时 ， 由 不 一 致 条 件 引 起 的 冲突 效应 增加 ， 表 明 不 
和 谐 泛音 会 占用 大 量 的 认 知 资源 并 且 影响 听 者 的 
执行 功能 (Bonin & Smilek, 2016; Masataka & 
Perlovsky, 2013; Seror & Neill, 2015), mH, 模式 
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匹配 理论 (Pattern Matching Theory) 和 时 域 自 相关 
理论 (Temporal Autocorrelation Theory) 还 强调 ， 泛 
音 和 谐 性 影响 音 高 表征 的 准确 度 进而 引发 音乐 协 
和 性 的 知觉 体验 (de Cheveigné, 2005; Harrison & 
Pearce, 2020; McDermott & Oxenham, 2008)。 模式 
匹配 理论 认为 ,长 时 记忆 储存 和 谐 泛音 的 频谱 特 
征 ， 如 果 听 觉 信息 与 之 吻合 ,即便 基 音 缺失 了 
(fundamental missing)， 大 脑 也 能 够 自动 地 利用 泛 
音 与 基 音 的 倍 频 关系 补 全 并 感知 到 音 高 (Feng & 
Wang, 2017; Oxenham, 2018)。 所 以 ， 和 谐 泛音 的 
音 高 知觉 起 来 清晰 明确 , 不 和 谐 泛音 在 匹配 中 会 
出 现 多 个 “虚拟 音 高 ”(virtual pitch)， 从 而 造成 音 
高 不 可 辩 的 杂乱 音响 (Milne et al., 2016; Parncutt 
& Hair, 2011; Stolzenburg, 2015)。 如 图 1c tax, W 
和 音程 P5( 纯 五 度 ) 的 泛音 列 和 谐 度 较 高 ， 因 而 有 
明确 的 音 高 值 (F0 等 于 原来 两 个 泛音 列 的 最 大 公 
约 数 ), 不 协和 音程 Tritone (三 全 音 ) 的 泛音 列 错落 
不 均 , 无 法 被 听觉 系统 有 效 地 处 理 ， 所 以 引起 不 
愉悦 的 体验 。 因 此 ， 音 高 知觉 流畅 性 是 引起 音乐 
协和 感 的 重要 原因 。 时 域 自 相关 理论 认为 ， 听 觉 
系统 根据 声波 在 时 域 上 的 周期 性 变化 来 表征 泛音 
的 和 谐 性 ,并 且 以 求 最 小 正 周期 的 方式 推测 音 
高 值 。 比值 复杂 的 不 协和 音程 由 于 自 相 关系 数 低 
导致 泛音 列 的 周期 性 差 。 例 如 ,小 二 度 产生 的 几 
个 虚拟 音 高 值 甚至 低 于 人 类 的 乐音 感知 阔 限 
(30 Hz) (McDermott & Oxenham, 2008)。 实 际 上 ， 
两 种 理论 争论 的 焦点 在 于 听觉 系统 计算 音 高 的 
方式 , 根据 侍 里 叶 变 换 原理 ,声波 在 时 域 上 的 周 
期 性 等 价 于 在 频 域 上 的 和 谐 性 , 但 两 种 理论 在 


论 (Beat Theory) 目 前 仍然 是 现代 音乐 学 教材 中 普 
iad HESS HY ULAR o 
3.1 ” 拍 频 理论 

在 音乐 知觉 测量 中 ， 赫 尔 姆 霍 效 同样 意识 到 
泛音 特征 的 重要 ,但 并 未 像 拉 英 等 人 一 样 把 音程 
协和 性 看 作 是 泛音 列 的 和 谐 自 然 ， 而 是 转向 研究 
泛音 之 间 的 相互 作用 及 对 听觉 系统 的 影响 
(Bowling & Purves, 2015)。 他 认为 , “自然 泛音 之 和 
谐 只 能 称 叹 宇宙 法 则 之 神奇 ， 再 无 它 用 ， 因 为 自 
然 界 中 美 与 丑 的 存在 概率 相同 ,事物 的 自然 性 并 
不 足以 证 明 它 是 精美 的 。 相 反 , 一 些 音程 之 所 以 
不 协和 是 因为 听 起 来 杂乱 刺耳 ， 其 原理 是 两 个 旭 
率 相近 的 声波 相遇 时 会 发 生 干 涉 效应 ， 出现 振幅 
涨 落 、 强 弱 不 均 的 拍 频 现 象 , 由 此 引起 基底 膜 上 
听觉 感受 器 的 间 钦 性 兴奋 从 而 导致 不 舒服 之 感 ” 
(Helmholtz, 1885)。 这 种 令 人 不 愉悦 的 体验 可 以 定 
义 为 粗糙 感 roughness)。 粗 糙 感 影响 音程 协和 性 。 
和 声 听 起 来 协和 是 因为 粗糙 感 不 明显 ， 听 起 来 不 
协和 是 因为 粗糙 感 明 显 ( 如 图 1d tas, 在 不 协和 
音程 三 全 音 中 ， 频 率 相 近 的 泛音 列 在 基底 膜 相 应 
位 置 引 发 了 拍 频 效 应 )。 所 以 ， 音 程 使 用 应 该 遵循 
简单 整数 比 原则 ， 防 止 泛 音 过 于 紧凑 引起 明显 的 
粗糙 感 。 

拍 频 理论 提出 后 , 大 量 的 生理 声学 和 心理 声 
学 的 实验 结果 都 相继 支持 了 这 一 假设 。 贝 凯 西 的 
耳蜗 振动 研究 对 推动 拍 频 生理 机 制 探 索 具 有 里 程 
碑 的 意义 (von Békésy, 1960)。 基 于 听觉 位 置 理论 ， 
贝 凯 西 发 现 ， 耳蜗 基底 膜 以 行 波 的 形式 振动 ,不 
同 的 声波 频率 分 别 对 应 于 基底 膜 不 同位 置 的 响 


= 


音 高 知觉 流畅 性 是 引发 音乐 协和 性 的 观点 上 


应 。 这 项 工作 不 仅 令 他 获得 了 1961 年 诺 贝尔 生理 


无 分 歧 。 

总 的 来 说 ，17 世纪 的 科学 革命 促进 了 物理 声 
FRR, 在 实证 主义 思想 推动 下 ， 研 究 者 开始 将 
目光 从 数理 哲学 转向 声学 ， 发 现 泛 音 与 音乐 协和 
性 的 联系 ,逐渐 形成 了 泛音 和 谐 性 理论 。 


3 音乐 协和 性 的 感知 之 美 


声学 的 物理 特征 是 导致 声音 协和 与 否 的 外 在 
条 件 ， 人 耳 如 何 感知 声学 线索 才 是 引发 音乐 协和 
性 的 关键 。 协 和 性 归根 结 底 是 人 类 的 听觉 体验 。 
所 以 , 到 19 世纪 ,部 分 学 者 开始 研究 音乐 引起 的 
生理 -心理 反应 机 制 ， 而 非 只 关注 物理 现象 。 赫 尔 
姆 霍 兹 就 是 这 一 领域 的 先驱 者 ,他 提出 的 拍 频 理 


与 医学 奖 , 更 让 大 量 的 心理 声学 数据 可 以 直接 与 
基底 膜 振 动 图 谱 数 据 比 较 (Bowling & Purves, 
2015)。 在 比较 中 ,研究 者 发 现 ， 耳 蜗 就 像 是 一 个 
天 然 的 分 频 滤 波 器 ， 上 面 布 满 了 一 系列 相互 交友 
的 负责 响应 特定 频率 范围 的 听觉 感受 器 ， 当 两 个 
声波 频率 相近 时 ,激励 的 感受 器 范围 有 很 大 一 部 
分 重合 ,这 部 分 重 辣 区 域 就 会 受到 双 音 拍 频 效应 
影响 引起 粗糙 感 (Greenwood，1961; Vassilakis, 
2005; Schneider 2018)。 因 此 ， 研 究 者 将 出 现 粗糙 
感 的 频率 差 值 范围 称 为 临界 频带 (critical bands), 
如 果 两 个 声波 的 频率 刚好 落 在 相同 临界 频带 内 就 
会 引起 粗糙 感 ， 落 在 临界 频带 外 就 不 引起 粗糙 感 
(Greenwood, 1991; Plomp & Levelt, 1965; Vassilakis, 
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2005)。 例 如 ， 同 时 呈现 两 个 频率 值 为 用 , 户 ( 几 > 户 ) 
的 纯音 (正弦 波 )， 其 释 加 形成 的 信号 可 表示 为 : 
sin(27 f 1t) +sin(2z f 2t) (1) 
根据 和 差 化 积 公式 ， 上 式 也 可 变 为 ; 


2sin [je 二 (2) 


当 双 音 之 间 的 频率 差 值 足够 大 时 ， 听 者 知觉 到 的 
是 公式 (1)， 此 时 仍然 是 两 个 清晰 可 辨 的 频率 为 
人 及 .2 的 声音 信号 ; 但 当 双 音 只 有 较 小 的 频率 差 值 
时 , 听 者 所 知觉 到 的 是 公式 (2),， 这 时 又 加 信号 以 
频率 为 (fl + f2)/ 2, 振幅 涨 落 为 Af= 甩 一 及 的 方式 
振动 。 其 中 , 较 慢 的 振幅 涨 落 (Af= 0.1~5 Hz) 在 响 
度 上 不 会 被 知觉 为 不 愉悦 ， 甚 至 听 起 来 像 一 个 融 
@ i (fusion), 但 快速 振荡 的 振幅 涨 落 (Af = 20~ 
250 Hz) 会 引起 忽 强 忽 弱 的 刺耳 拌 动 (Harrison & 
Pearce, 2020; Shapira & Stone, 2008)。 所 以 ,临界 
频带 范围 实际 就 是 双 音 可 辨 一 -粗糙 感知 觉 一 一 
双 音 完全 融合 的 变化 范围 。Plomp 和 Levelt (1965) 


(tetrads) 和 弦 高 于 双 音 (dyads) 协 和 性 的 情况 大 量 
存在 (Bowling & Purves, 2015)。 听 者 对 纯音 (不 含 
5) 


泛音 )、 只 含 少数 泛音 的 复合 音 和 含有 较 多 泛音 外 
复合 音 在 协和 度 评价 上 没有 显著 差异 , 说 明 泛 音 
的 有 无 及 数量 都 不 影响 协和 性 知觉 (McLachlan 
et al., 2013), 这 显然 与 拍 频 理论 的 泛音 干涉 效应 
的 假设 相 违 。 

尽管 许多 研究 者 从 不 同 的 方面 指出 了 拍 频 理 
论 的 局 限 性 , 但 都 未 能 够 实质 性 地 否认 拍 频 对 音 
乐 协 和 性 的 作用 ， 因 为 在 通常 的 情况 下 , 不 协和 
音程 同时 包含 了 拍 频 较 明显 和 泛音 不 和 谐 两 种 特 
征 ， 因 此 很 难 准确 地 计算 某 一 种 因素 的 贡献 ， 也 
就 很 难 拒绝 某 一 种 理论 假设 。McDermont 等 人 
(2010) 不 但 分 离 了 两 种 因素 的 相互 影响 ,还 直接 
计算 了 每 种 因素 与 音乐 协和 性 的 相关 。 该 研究 分 
析 了 三 个 重要 的 指标 : (1) 对 音乐 协和 性 的 偏好 ， 
以 被 试 对 协和 音程 与 不 协和 音程 的 喜好 程度 差异 
来 衡量 ; (2) 对 拍 频 的 厌恶 ， 以 在 双 耳 分 听 与 双 耳 


计算 ， 纯 音 音程 的 最 大 协和 度 发 生 在 临界 宽带 值 
的 125%， 极 度 不 协和 音程 发 生 在 临界 宽带 值 的 
25%。 后 续 的 研究 也 引入 了 新 算法 估计 临界 频带 
对 复合 音 协 和 度 的 影响 (Bernini & Talamucci, 2014; 
Vencovsky, 2016)。 拍 频 理论 的 建立 使 得 音乐 审美 
感受 和 人 耳 内 部 生理 构造 及 活动 规律 进行 了 有 效 
的 结合 。 与 泛音 和 谐 论 的 观点 类 似 ,， 拍 频 理论 也 
强调 音乐 协和 性 建立 在 一 般 感知 水 平 上 并 且 受 听 
觉 加 工 系统 的 约束 。 

3.2 ” 拍 频 理论 面临 的 挑战 

虽然 拍 频 理论 是 上 世纪 的 主流 观点 ， 但 是 ， 
随 着 研究 的 深入 ， 拍 频 理论 受到 了 前 所 未 有 的 挑 
战 。 首 先是 该 理论 的 外 部 效 度 ， 因 为 拍 频 值 受 发 
生 干 涉 效 应 的 声音 频率 成 分 的 振幅 和 相位 影响 ， 
这 些 因 素 在 不 同 乐 器 之 间 差 异 很 大 (Kohlrausch 
et al., 2000; Plack, 2010)， 所 以 拍 频 不 是 衡量 音乐 
协和 性 的 可 靠 线索 。 其 次 ， 拍 频 也 不 是 引发 协和 
感 的 关键 原因 。 采 用 双 耳 分 听 (dichotic) 方 式 给 
试 呈现 音乐 刺激 时 ， 拍 频 效 应 导致 的 粗糙 感 被 显 
著 降 低 了 (两 个 声音 分 别 作用 于 双 侧 耳蜗 从 而 避 
免 了 干涉 效应 )， 却 未 影响 音程 协和 性 的 评价 ， 说 
明 拍 频 对 音乐 协和 性 的 作用 很 小 (Bidelman & 
Krishnan, 2009; McDermott et al., 2010)。 更 为 有 趣 
的 是 , 按照 拍 频 理 论 , 构成 和 弦 的 音符 越 多 ， 理 
应 造成 更 明显 的 粗糙 感 ， 但 三 音 (triads) 甚 至 四 音 


同 听 条 件 下 对 纯音 喜好 程度 差异 来 衡量 ; (3) 对 泛 
音 和 谐 性 的 偏好 ， 以 对 和 谐 泛音 与 不 和 谐 泛音 (人 
为 进行 泛音 扰动 处 理 ) 喜 好 程度 差异 来 衡量 。 结 
表明 ,尽管 被 试 并 不 喜欢 拍 频 明显 的 和 声 ， 但 对 
拍 频 的 厌恶 与 对 音乐 协和 性 的 偏好 却 没有 相关 性 ， 
对 和 谐 泛音 的 偏好 显著 预测 了 对 音乐 协和 性 的 优 
好 ， 充 分 说 明 影 响 音 乐 协和 感 的 关键 性 因素 并 不 
是 拍 频 的 有 无 。 另 外 ， 对 先天 性 失 音 症 (congenital 
amusia) 人 研究 表明 ， 失 音 症 病人 不 能 像 正 常 被 试 一 
样 区 分 音程 协和 性 (Cousineau et al., 2012; Zhou 
et al.，2019)， 但 对 听觉 粗糙 感 的 知觉 评价 却 与 正 
常 被 试 无 异 ， 二 者 都 喜欢 拍 频 不 明显 的 刺激 而 厌 
恶 拍 频 明显 的 刺激 , 说明 失 音 症 的 音乐 协和 性 加 
工 缺 陷 与 拍 频 因素 无 关 (Cousineau et al., 2012)。 总 
的 来 说 ， 拍 频 理论 一 直 强 调 没有 粗糙 感 是 导致 音 
程 听 起 来 协和 的 原因 ， 却 忽略 了 协和 音程 本 身 可 
能 具有 的 美学 机 理 , 正如 Bowling 和 Purves (2015) 
所 评论 的 , 不 苦 并 不 是 糖 吃 起 来 甜 的 原因 。 


4 生物 与 文化 的 融合 之 美 


音乐 是 声音 组 合 的 艺术 。 不 同 国家 和 民族 都 
能 以 独特 的 形式 自由 灵活 地 创作 音乐 ,进而 形成 
了 风格 迎 异 、 百 家 齐 放 的 音乐 文化 。 作 为 音乐 审 
美的 核心 要 素 , 音乐 协和 性 在 多 大 程度 上 受 生物 
学 因素 影响 有 很 大 的 争论 。 许 多 研究 者 认为 ， 协 
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和 性 偏好 是 由 于 人 类 听觉 系统 对 协和 音程 的 声学 
物理 特征 存在 加 工 优势 ， EK TE A RUA 
统 的 先天 适应 性 机 制 (Bidelman，2013; Bowling 
et al., 2017; Virtala & Tervaniemi, 2017)。 但 是 ， 民 
族 音 乐 学 家 (ethnomusicologist) 和 作曲 家 反对 这 一 
观点 ， 认 为 音乐 协和 性 是 后 天 习 得 的 审美 经 验 
存在 较 大 的 文化 差异 和 个 体 差 异 (Brown & 
Jordania, 2013; McDermott et al., 2016; Popescu 
et al., 2019)。 由 此 ,引发 了 音乐 协和 性 起 源 的 先天 
与 后 天 之 争 。 

41 生物 决定 论 

持 生 物 决 定论 观点 的 学 者 认为 ， 音 乐 协和 性 
知觉 是 人 类 与 生 俱 来 的 天 赋 才 能 。 首 先 ， 发 展 心 
理学 的 证 据 表 明 , 19 到 40 个 月 大 的 儿童 对 不 同 协 
和 程度 的 音乐 刺激 表现 出 明显 的 偏好 差异 ， 他 们 
花费 更 长 的 时 间 探 索 那 些 发 出 协和 音乐 声响 的 玩 
具 (di Stefano et al., 2017). 6 ^H (Crowder et al., 
1991; Trainor & Heinmiller, 1998), 4 ^H (Trainor 
et al., 2002; Zentner & Kagan, 1996) 甚 至 2 个 月 大 
的 婴儿 (Trainor et al.，2002) 也 都 展现 出 音乐 协和 
性 的 知觉 反应 能 力 和 偏好 行为 。Zentner 和 Kagan 
(1996) 采 用 转 头 偏好 范式 考察 了 4 个 月 大 婴儿 的 
音乐 协和 性 知觉 能 力 ， 发 现在 播放 协和 音乐 时 ， 
婴儿 表现 出 更 少 的 头 部 运动 并 且 对 声 源 刺 激 方向 
注视 更 长 的 时 间 。 父 母 是 礁 哑 人 的 婴儿 对 协和 音 
程 产生 强烈 的 喜爱 , 说 明 音乐 知觉 经 验 不 是 导致 
婴儿 形成 协和 感 的 主要 因素 , 这 就 排除 了 教养 或 
环境 暴露 等 学 习 效 应 的 影响 (Masataka, 2006)。 一 
些 神经 科学 研究 甚至 发 现 ， 新生 儿 就 已 经 具有 音 
乐 协 和 感 ， 这 无 疑 为 音乐 审美 先天 论 的 观点 提供 
了 强 有 力 的 证 据 (Perani et al., 2010; Virtala et al., 
2013)。 但 是 ， 近 期 采用 转 头 偏好 范式 的 研究 却 未 
能 够 重复 以 往 的 实验 结果 ， 只 发 现 了 熟悉 性 对 协 
和 性 知觉 的 影响 ， 因 此 质疑 早期 使 用 类 似 范式 的 
研究 可 能 混淆 了 刺激 材料 的 熟悉 性 和 新 异性 
(Plantinga & Trehub, 2014)。 但 不 管 怎 样 ， 这 些 对 
儿童 早期 的 实证 研究 至 少 说 明 音 乐 协和 性 知觉 产 
生 与 人 类 的 生物 学 基础 存在 着 很 大 的 关联 。 

不 同文 化 对 音阶 (scale) 的 使 用 也 佐证 了 这 一 
猜测 。 人 类 在 中 等 音 阀 范围 内 至 少 能 够 分 辨 240 
个 音 高 ,在 原则 上 应 该 有 大 量 的 音阶 用 来 创作 音 
乐 , 但 是 , 无 论 是 西方 古典 音乐 、 现 代 流行 音乐 、 
中 国 传统 民乐 及 其 它 文 化 的 音乐 都 只 使 用 5 到 7 


个 相似 的 音阶 音 级 (Bowling et al., 2017; Gill & 
Purves, 2009), 并 且 不 约 而 同 地 构成 了 相似 的 和 
声音 程 (Bowling et al., 2017; Bowling & Purves, 
2015)， 甚 至 不 同 国家 出 土 的 早期 乐器 也 都 只 含有 
这 几 个 音阶 ,修缮 后 竟然 还 能 演奏 出 协和 音响 
(Conard et al., 2009; Killin, 2018)。 这 充分 说 明 ， 先 
天 的 生物 学 因素 约束 了 人 类 对 音阶 的 选择 ,也 约 
束 了 和 声音 程 的 知觉 加 工 。 最 后 ， 两 种 主流 的 音 
乐 协和 性 理论 都 支持 音乐 审美 先天 论 的 假设 。 泛 
音 和 谐 论 认为 ， 人 脑 预 装 有 自然 泛音 特征 识别 器 ， 
加 工 与 之 吻合 的 有 简单 频率 比 的 协和 音程 时 会 引 
起 流畅 的 愉悦 体验 ,加 工 与 之 不 吻合 的 有 复杂 声 
学 特征 的 不 协和 音程 会 引起 负 性 体验 。 拍 频 论 认 
为 ,听觉 器 官 的 生理 构造 是 导致 复杂 不 协和 音程 
引起 粗糙 感 的 原因 。 所 以 ， 二 者 都 强调 音乐 协和 
性 是 先天 听觉 机 制 在 处 理 特 定 声音 刺激 时 引发 的 
情感 效应 ， 只 不 过 前 者 认为 该 过 程 发 生 在 大 脑 的 
神经 系统 ,后 者 认为 该 过 程 发 生 在 耳蜗 的 基底 
膜 。 因此， 人 类 的 音乐 协和 性 知觉 可 能 是 一 种 先 
天 的 音乐 才能 。 

4.2 文化 决定 论 

民族 音乐 学 家 和 作曲 家 把 音乐 协和 性 看 作 一 
种 审美 经 验 ， 认 为 文化 背景 和 后 天 音乐 训练 塑造 
了 个 体 的 音乐 协和 性 知觉 。 首 先 ， 和 声音 乐 的 审 
美观 念 在 不 同文 化 之 间 差 异 较 大 。 例 如 ,巴厘 岛 
甘美 兰 (Gamelan) 音 乐 在 演奏 时 产生 非常 明显 的 
拍 频 效应 ， 这 种 引起 粗糙 感 的 音乐 形式 在 当地 二 
分 盛行 (Harrison & Pearce, 2020; Plantinga & 
Trehub，2014)。 在 中 东 、 印 度 北部 、 立 陶 宛 、 波 
斯 尼 亚 以 及 巴布亚 新 几内亚 等 地 区 ， 人 们 更 是 主 
动 追 求 器 乐 帮 至 声乐 间 的 拍 频 复 调 (beat diaphony), 
说 明 拍 频 在 这 些 文化 中 被 视 为 令 人 愉悦 的 协和 音 
乐 JG X (Ambrazevičius, 2017; Harrison, 2021; 
Vassilakis, 2005)。 事 实 上 ， 拍 频 效应 的 文化 差异 被 
民族 音乐 学 家 广泛 考证 , 但 许多 研究 者 在 撰写 结 
论 时 往往 忽略 了 这 些 因 素 (Plantinga & Trehub, 
2014)。 其 次 ， 听 者 对 音乐 协和 性 的 知觉 评价 也 受 
接触 程度 影响 。Meyer (1903) 报 告 说 ， 被 试 初 次 接 
触 微分 音乐 (microtonal music) 时 会 感到 很 不 协和 ， 
重复 播放 了 12 到 15 遍 后 ， 大 多 数 参 与 者 都 自发 
地 表示 听 起 来 还 不 错 。Valentine (1914) 指 出 ， 当 把 
一 些 不 协和 音程 重复 听 33 遍 ， 被 试 会 认为 它 是 协 
和 的 。 不 过 ,这 些 早 期 的 研究 报告 并 未 考虑 纯粹 
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接触 效应 (mere exposure) 的 影响 (Montoya et al., 
2017)。 后 来 的 研究 发 现 , 仅仅 是 短暂 的 实验 室 训 
练 就 能 够 显著 地 提高 被 试 对 协和 音程 的 偏好 效应 
(McLachlan et al., 2013)， 对 受过 专业 训练 的 音乐 
家 来 说 ， 偶 好 效应 更 加 显著 (Brattico et al., 2009; 
Dellacherie et al., 2011; McDermott et al., 2010). 
即便 是 未 受过 音乐 教育 的 儿童 ， 随 着 年 龄 的 增长 ， 
对 音乐 协和 性 的 知觉 也 会 提高 (Weiss et al., 2020)。 
这 些 来 自 跨 文化 、 音 乐 训练 和 毕生 发 展 的 研究 结 
果 都 向 音乐 协和 性 的 生物 本 能 论 发 起 了 挑战 。 

把 这 场 争论 推 向 高 潮 的 是 2016 年 刊登 在 
Nature 杂志 的 封面 文章 (McDermott et al., 2016)。 
该 文系 统考 察 了 协和 音程 偏好 在 多 大 程度 上 是 受 
现代 和 声音 乐 文化 影响 。 作 者 选取 了 玻利维亚 热 
带 雨 林 中 仍然 过 着 原始 狩猎 采摘 生活 的 提 斯 曼 人 
(Tsimane) 和 生活 在 城市 和 乡镇 过 着 现代 生活 的 玻 
利 维 亚 人 以 及 完全 生活 在 西方 和 声音 乐 文化 下 的 
美国 人 (音乐 家 和 非 音 乐 家 )。 结果 发 现 , 虽然 提 斯 
曼 人 在 声音 情感 知觉 和 音乐 粗糙 度 的 分 辩 能 力 上 
与 对 照 组 相差 不 大 , 但 提 斯 曼 人 却 给 予 协和 与 不 
协和 音程 以 相同 等 级 的 愉悦 度 评价 。 相 反 ,， 生活 
在 城市 及 乡镇 的 玻利维亚 人 却 显著 地 偏好 协和 音 
程 ， 偏 好 程度 依次 低 于 美国 的 非 音 乐 家 和 音乐 
Zo XWH, 音乐 协和 感 的 形成 与 接触 现代 和 声 
音乐 文化 的 程度 有 关 。 如 果 一 个 地 区 完全 没有 被 
和 声音 乐 影 响 ， 这 里 的 人 们 就 可 能 就 缺乏 音乐 协 


以 , 音乐 协和 性 的 形成 极 可 能 是 神经 系统 与 文化 
长 期 相互 作用 的 产物 ， 而 不 是 单方 面 的 因素 所 致 。 
4.3 ”比较 心理 学 的 介入 

音乐 协和 性 起 源 问题 所 以 悬而未决 ， 一 个 重 
要 原因 是 无 法 完全 避免 先天 生物 学 因素 和 后 天 环 
境 变 量 的 相互 影响 ,因为 以 人 类 为 被 试 的 研究 无 
法 真正 做 到 长 期 隔绝 一 切 声 音 刺激 。 比 较 心 理学 
研究 动物 行为 ， 能 够 提供 有 效 控制 后 天 环境 接触 
的 手段 (Harrison & Pearce, 2020; Toro & Crespo- 
Bojorque, 2017)。 在 实验 室 条件 下 , 动物 在 出 生前 就 
被 隔绝 外 部 声音 刺激 ， 所 以 , 动物 表现 出 来 的 任何 
行为 偏好 都 可 以 排除 后 天 接触 特定 听觉 信息 (如 自 
然 泛 音 接触 ) 的 有 影响。 动物 不 具有 产生 音乐 的 能 力 ， 
因此 ,任何 音乐 偏好 性 反应 都 可 以 视 作 是 生物 普 
遍 性 的 一 般 听觉 加 工 ， 而 不 是 音乐 特有 的 认 知 加 
工 。 因 此 ， 比 较 心 理学 是 考察 音乐 协和 性 究竟 是 
先天 性 行为 还 是 习 得 性 行为 的 重要 方法 ， 也 是 理 
解 音乐 初始 状态 以 及 这 种 初始 状态 如 何 被 相关 经 
验 塑造 的 重要 途径 (Toro & Crespo-Bojorque, 2017). 

相关 的 研究 主要 集中 在 分 类 能 力 和 偏好 行为 
上 (图 2)。 研 究 表明 ， 部 分 鸟 类 和 灵 长 类 动物 经 过 
训练 以 后 能 够 准确 地 区 分 协和 音程 和 不 协和 音程 ， 
WIERE (Watanabe et al., 2005), MME 
(Hoeschele et al., 2012), KIN tf (Hulse et al., 
1995) Ail A ÆRE (Azumi, 2000), 并 且 能 够 将 这 种 
分 类 能 力 迁 移 至 新 的 音乐 刺激 。 猴 子 的 初级 听觉 


和 性 知觉 。 所 以 , 音乐 协和 性 不 是 先天 的 知觉 偏 
好 反应 ,文化 因素 在 音乐 审美 方面 起 到 了 巨大 作 
用 。 提 斯 曼 人 没有 聆听 或 演奏 和 声音 乐 的 经 历 ， 
他 们 的 音乐 属于 仅 有 一 条 旋律 线 的 单 音 音乐 
(Monophony)， 是 最 简单 的 音乐 形式 ， 西方 和 声音 
乐 至 少 有 两 条 以 上 的 旋律 线 交 织 ， 所 以 ， 提 斯 曼 
人 没有 形成 音乐 协和 感 可 能 是 缺乏 对 纵向 多 线程 
音乐 的 知觉 经 验 (McDermott et al., 2016; McPherson 
et al.，2020)。 知 觉 磁 体 效 应 (perceptual magnet 
effect) 也 能 够 说 明 这 一 现象 ,婴儿 早期 能 够 分 辨 大 
量 的 语音 范畴 ,但 所 处 的 语言 环境 如 果 缺 少 对 某 
些 声音 的 分 辨 要 求 (例如 日 语 中 的 “* 和 “1”*), 在 特 
定 的 年 龄 后 对 这 些 声音 的 分 辨 能 力 就 会 消失 
(Werker & Hensch, 2015)， 表 明 人 类 的 听 党 系统 会 
根据 环境 的 需要 进行 调整 。 一 些 音乐 加 工 模型 也 
WA, 文化 和 经 验 通过 塑造 大 脑 的 皮层 奖赏 环 路 
影响 音乐 奖赏 系统 (Zatorre & Salimpoor, 2013)。 所 


皮层 (Fishman et al., 2001) 以 及 猫 的 听 神 经 (Tramo 
et al., 2001) 和 下 丘 (McKinney et al., 2001) 对 协和 
与 不 协和 音程 的 神经 反应 有 显著 差异 ， 说 明 一 般 
性 的 听觉 机 制 是 导致 某 些 动物 掌握 音乐 协和 性 分 
类 能 力 的 重要 原因 。 研 究 还 发 现 ,一些 动物 幼 妃 
能 够 立即 表现 出 音乐 协和 性 的 偏好 行为 。 例 如 
刚 旷 化 的 小 鸡 会 对 播放 有 协和 旋律 的 视觉 印记 表 
现 出 明显 的 接近 行为 (Chiandetti & Vallortigara, 
2011)。 黑 猩猩 幼 嘎 也 更 喜欢 通过 连接 在 它 有 骆 膊 上 
的 装置 播放 协和 音乐 旋律 ， 提 示人 类 可 能 与 同 在 
系统 发 育 上 接近 的 黑猩猩 共享 音乐 协和 性 的 进化 
起 源 (Sugimoto et al., 2010)。 但 是 ， 当 使 用 孤立 的 
和 声音 程 为 刺激 时 , 棉花 项 面 绢 毛 猴 在 V 型 迷宫 
并 未 在 协和 音程 附近 逗留 更 的 长 时 间 (Koda et al., 
2013)。 与 之 相反 ， 人 类 的 音乐 协和 性 偏好 不 仅 在 
完整 旋律 条 件 下 显著 ,也 在 孤立 和 声 的 情况 下 存 
在 (McDermott et al., 2010; Toro & Crespo-Bojorque, 
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图 2 不 同 物种 对 协和 与 不 协和 音乐 的 分 辩 能 力 和 偏好 反应 的 实验 结果 总 结 


2017), 说 明 较 少 的 音乐 信息 对 比 可 能 不 足以 引起 经 验 和 文化 通过 审美 观念 自 上 而 下 地 调节 音乐 协 
某 些 非 类 人 猿 灵 长 类 动物 的 音乐 协和 性 知觉 。 和 性 知觉 (Friedman et al., 2021; Parncutt & Hair, 

为 了 排除 动物 自身 叫 声 的 影响 ,研究 者 采用 2011; Parncutt et al., 2019)。Bowling 等 人 (2017) 
路 齿 类 动物 如 褐 家 鼠 为 研究 对 象 (Crespo-Bojorque 认为 ， 忽视 生物 因素 或 环境 信息 的 任何 一 方 都 无 
& Toro, 2015; Postal et al., 2020)。 因 为 与 大 多 数 常 法 准确 说 明 音 乐 协和 性 的 产生 ， 所 以 多 因素 混合 
发 出 和 谐 泛 音 叫 声 的 动物 不 同 ， 褐 家 鼠 的 叫 声 一 理论 是 解释 音乐 协和 性 产生 的 最 佳 方式 。 最 有 说 
般 不 具有 和 谐 泛 音 特 征 , 在 多 数 情 况 下 是 纯音 样 服 力 的 证 据 来 自 Harrison 和 Pearce (2020) 归 纳 的 
的 超声 波 ， 这 就 为 验证 泛音 和 谐 性 的 知觉 接触 理 混合 计算 模型 。 他 们 重新 评估 了 此 前 分 别 基于 泛 
论 控制 了 自身 叫 声 这 一 混淆 变量 。 研 究 发 现 ， 即 音 和 谐 性 、 拍 频 效应 以 及 文化 特征 三 种 因素 理论 
便 褐 家 鼠 在 强化 训练 下 习 得 了 分 辨 协和 音程 与 不 的 几 种 经 典 模型 的 预测 力 ， 发 现 尽管 依据 不 同 理 
协和 音程 的 能 力 , 但 不 能 泛 化 至 其 他 新 的 音程 刺 论 建 立 的 模型 在 预测 力 上 存在 着 差异 , 但 三 种 因 
激 ， 也 不 能 迁移 至 倍 频 转 换 (octave transpositions) 素 都 是 衡量 音乐 协和 性 的 有 效 指标 。 而 且 ,， 重新 
音程 条 件 ， 说 明 褐 家 鼠 只 是 暂时 记 住 了 音程 间 的 拟 合 一 个 同时 包含 这 些 因 素 的 混合 计算 模型 以 
绝对 频率 差异 。 导 致 褐 家 鼠 不 具有 音乐 协和 性 知 预测 力 提 高 至 88.95%， 显 著 大 于 此 前 所 有 的 单 
觉 能 力 的 原因 可 能 是 缺乏 和 声音 乐 或 和 谐 泛音 的 素 计算 模型 。 作 者 还 利用 音乐 语料库 分 析 法 ， 
接触 经 验 (Crespo-Bojorque & Toro, 2015; Toro & 察 了 过 去 千年 间 的 10000 Wit, BRA TS 
Crespo-Bojorque，2017)。 未 来 研究 可 以 让 褐 家 鼠 乐 作品 的 和 弦 流 行 性 (chord prevalence). 结果 发 现 ， 
自 出 生前 就 暴露 在 这 些 声学 线索 中 ， 以 考察 接触 泛音 和 谐 性 对 和 区 流 行 性 的 预测 有 显著 的 正 相关 ， 
经 验 是 否 对 音乐 协和 性 偏好 有 塑造 作用 。 总 之 ， 拍 频 效应 与 和 疏 流行 性 呈 显 著 的 负 相 关 , 说 明 一 
比较 心理 学 是 理解 音乐 知觉 如 何 受 后 天 文化 环境 直 以 来 作曲 家 都 更 青睐 在 创作 中 添加 泛音 和 谐 的 
卫 陶 的 重要 手段 。 而 且 , 音乐 协和 性 也 并 非 为 人 音乐 元 素 ， 尽 量 避 免 使 用 那些 可 能 引发 听众 不 愉 
类 所 特有 ， 一 些 动物 与 人 类 在 发 音 - 听 觉 系统 可 悦 情绪 的 粗糙 感 元 素 ， 再 次 证 实 音乐 协和 性 同时 


k a m 


能 存在 相似 的 进化 起 源 。 受到 拍 频 效应 和 泛音 协和 性 影响 。 综 上 , 音乐 协 
44 多 因素 混合 理论 和 性 是 由 多 种 因素 引起 的 音乐 审美 知觉 ,未 来 研 


为 了 弥合 音乐 协和 性 理论 中 的 先天 论 与 后 天 。 ” 究 应 该 试图 分 离 这 些 因素 的 相互 作用 ， 以 确定 加 
论 之 争 ， 一 些 研究 者 提出 了 整体 性 概念 结构 理论 ， 。 工 这 些 信息 是 否 存 在 共享 的 神经 通路 。 
认为 生物 学 因素 与 文化 因素 共同 影响 音乐 协和 性 P na 
BARD Af 经 | 
知觉 。 其 中 ， 和 谐 泛音 列 是 引起 协和 感 的 主要 因 O ”音乐 协和 性 的 认 知 神经 机 制 
素 ， 拍 频 效应 是 导致 不 协和 感 体验 的 主要 原因 ， 近 20 年 来 ， 随 着 认 知 神经 科学 的 发 展 ， 借 且 
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神经 电 生理 (如 ERP) 和 脑 成 像 (如 fMRD) 等 技术 ， 
研究 者 在 解析 音乐 协和 性 的 认 知 加 工 机 制 方面 取 
得 重要 进展 。 大 量 的 证 据 表 明 ， 人 脑 对 和 声音 程 
的 加 工 遵循 自 下 而 上 的 加 工 模式 ， 与 音乐 协和 性 
相关 的 音 高 信息 在 传人 高 级 皮层 之 前 就 已 经 被 初 
步 处 理 ， 这 些 初 期 感觉 编码 形式 遵循 高 水 平 的 音 
乐 层级 规则 ,而 非 简单 的 声学 物理 特征 , 说 明 音 
乐 协 和 性 的 认 知 体验 基于 感觉 水 平 的 神经 活动 
(Bidelman, 2013; Bidelman & Grall, 2014; Bidelman 
& Heinz, 2011; Bidelman & Krishnan, 2009; Bones 
et al., 2014; Itoh et al., 2010; Kim et al., 2017)。 在 
早期 注意 阶段 ,初级 和 次 级 听觉 皮层 负责 音 高 信 
息 的 抽象 表征 (Bidelman & Grall, 2014; Itoh et al., 
2010)， 在 更 早期 的 前 注意 阶段 (pre-attentive 


乐 协 和 性 的 认 知 通路 可 能 起 源 于 脑 干 (Bidelman， 
2013; Bidelman & Heinz, 2011; Bidelman & 
Krishnan, 2009; Bones et al., 2014), FFR 是 周期 性 
声音 刺激 诱发 产生 的 听觉 脑 干 稳 态 响应 ， 反 映 脑 
干 神经 元 群 对 周期 性 声音 刺激 时 间 细 节 结 构 
(temporal fine structure) 的 同步 锁 相 活动 ， 因 此 ， 
利用 FFR 能 够 清晰 地 记录 和 比较 脑 干 对 不 同 协 和 
程度 音乐 刺激 的 同步 锁 相 能 力 差 异 (Bidelman， 
2013; Bidelman & Krishnan, 2009; Bones et al., 
2014; Coffey et al., 2016)。 研 究 发 现 ,协和 音程 比 
不 协和 音程 诱发 更 稳健 且 同 步 性 水 平 更 高 的 相位 
锁定 信号 (协和 音程 在 基 频 和 倍 频 处 诱发 的 频谱 
能 量 幅 度 更 大 且 更 集中 ), 信号 幅 值 与 被 试 的 评定 


结果 及 音乐 协和 怕 


E 的 等 级 程度 显著 相关 , 说 明 脑 


stages)， 皮 层 下 组 织 结构 (如 脑 干 和 听 神 经 ) 中 神 


经 元 群 的 锁 相 活动 是 编码 音 高 信息 的 认 知 通路 起 
源 (Bidelman，2013; Bidelman & Heinz, 2011; 
Bidelman & Krishnan, 2009; Bones et al., 2014; 
Kim et al., 2017). PM, 音乐 协和 性 认 知 偏好 在 皮 
层 和 皮层 下 水 平均 具有 生物 学 基础 。Itoh 等 人 
(2010) 利 用 ERP 技术 验证 脑 电信 号 反应 与 音乐 协 
和 人 性 的 等 级 顺序 存在 紧密 关联 ， 该 实验 任务 是 向 
被 试 随机 呈现 跨度 分 布 范围 在 0~13 个 半音 的 和 
声音 程 ， 发 现 200~300 ms 左右 诱发 的 N2 成 分 显 
著 地 受 音 程 协 和 性 高 低调 节 ,， 不 协和 音程 相 较 于 
协和 音程 诱发 了 波幅 更 大 的 N2, 构成 和 声音 程 的 
两 个 音符 音 高 之 比 越 简单 ， 诱 发 的 N2 波幅 就 越 
小 , 极度 符合 简单 频率 比 学 说 的 预测 , 说 明 大 脑 
皮层 的 神经 活动 对 音程 中 的 音 高 关系 非常 敏感 ， 
表征 这 些 音 程 信息 的 方式 与 标准 音乐 实践 的 协和 
性 分 类 原则 一 致 。 由 音 高 线索 引发 的 瞬 态 特异 性 
神经 信号 一 一 音 高 起 始 反 应 (pitch onset response) 
的 波幅 变化 也 与 行为 结果 及 音乐 协和 性 的 等 级 顺 
序 一 致 ， 再 次 证 明 音 乐 协 和 性 知觉 建立 在 低 水 平 
的 神经 反应 上 ， 而 且 早期 编码 形式 就 已 经 采用 了 
高 水 平 的 音乐 组 织 原 则 (Bidelman & Grall, 2014)。 
言语 加 工 过 程 的 语音 编码 (phonetic code) 模 式 也 
与 之 相似 , 初级 听觉 皮层 及 其 邻近 区 域 对 言语 信 
息 的 早期 加 工 同样 遵循 语音 信息 的 高 级 抽象 规则 
而 非 简单 的 声学 特征 (Scharinger et al., 2011), 提 
示 音 乐 和 语言 可 能 共享 特定 的 神经 基础 。 

在 皮层 下 水 平 , 研究 者 以 频率 跟随 啊 应 
(frequency-following response, FFR) 为 指标 发 现 音 


干 神经 元 群 的 锁 相 活动 中 储存 了 关于 音乐 协和 性 
音 高 等 级 关系 的 感觉 信息 ， 并 以 此 作为 最 初 的 编 
人 码 模式 (Bidelman & Krishnan, 2009)。 动 物 研 究 发 
现 ， 脑 干 (Tramo et al., 2001) #l F F (McKinney 
et al.，2001) 等 区 域 对 协和 音程 表现 出 更 稳健 的 同 
步 锁 相 活动 并且 能 够 有 效 地 预测 动物 的 音程 偏 
好 行为 。 所以， 人 类 和 动物 的 研究 都 表明 ,协和 音 
程 在 听觉 系统 中 存在 编码 优势 。 这 也 说 明 ， 相 较 
于 周期 性 不 规则 的 不 协和 音程 ,皮层 下 神经 元 群 
对 协和 音程 声学 特征 的 同步 锁 相 能 力 更 强 ,这 在 
很 大 程度 上 降低 了 大 脑 的 计算 负荷 。 换 言 之 ， 音 
乐 协 和 性 知觉 偏好 差异 反映 了 听觉 系统 对 音 高 层 
级 信息 表征 能 力 的 神经 生物 学 差异 。 总 之 , 发 生 
在 皮层 水 平 的 更 高 级 的 音乐 愉悦 感 体验 建立 在 皮 
层 下 水 平 的 神经 反应 基础 上 。 

大 脑 的 高 级 认 知 区 域 也 参与 音乐 协和 性 的 知 
觉 加 工 。Minati 等 人 (2009) 表 明 , PAN AMEX LEAS H 
和 和 弦 在 额 叶 中 下 回 (inferior and middle frontal 
gyri) 、 前 运动 皮层 (premotor cortex) 和 顶 下 叶 
(inferior parietal lobule) 等 区 域 诱 发 更 强 的 血 氧 动 
力学 信号 响应 ， 非 音乐 家 被 试 的 激活 水 平 表现 出 
明显 的 右 侧 化 优势 ， 音 乐 家 未 表现 出 明显 的 偏 侧 
化 。 但 是 , Foss 等 人 (2007) 的 研究 却 发 现 相反 的 音 
乐 协 和 性 效应 ,不 协和 音程 比 协 和 音程 在 非 音 乐 
家 的 右 侧 额 下 回 以 及 音乐 家 的 前 扣 带 回 (anterior 
cingulate cortex), #1 _E [E] (superior temporal gyrus), 
左 侧 额 叶 中 下 回 和 顶 下 叶 等 区 域 的 激活 水 平 更 
强 。 导 致 这 种 不 一 致 的 结果 可 能 是 实验 任务 和 和 刺 
WOM BLAS TAL, BAT OR FA eh ASK HT, FP BER 
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被 试 判断 每 个 和 弱 的 协和 性 (Minati et al., 2009), 
后 者 使 用 双 音 和 声 ， 被 试 只 需要 被 动 地 听 (Foss 
et al., 2007)。 此 外 , 在 一 项 系统 平衡 了 音符 数量 、 
音色 、 节 奏 及 旋律 轮廓 的 研究 中 ,不 协和 音程 比 
协和 音程 在 内 侧 前 额 叶 (medial prefrontal cortex) 
和 前 扣 带 回 唆 部 等 区 域 的 激活 水 平 更 高 (Bravo et 
al., 2020)。 有趣 的 是 ,这些 脑 区 是 负责 冲突 检测 及 
评估 负 性 情绪 和 疏 惧 相关 信息 的 脑 区 ， 而 且 在 不 
协和 条 件 下 ， 双 侧 初级 听觉 皮层 与 扣 带 回 之 间 的 
功能 连接 更 强 , 说 明 大 脑 在 处 理 不 协和 音乐 时 需 
要 更 多 的 信息 资源 参与 ， 也 证 实 了 不 协和 音程 具 
有 了 明显 的 负 性 效 价 信息 特征 。 与 之 相反 ,协和 音 
程 引发 的 正 性 愉悦 体验 有 极 高 的 奖赏 价值 (Gold 
et al., 2019; Zatorre & Salimpoor, 2013)。 项 采用 
预测 奖赏 错误 (reward prediction errors) 范 式 的 研 
究 发 现 ， 以 协和 音程 结尾 的 音乐 令 被 试 产生 动机 
性 学 习 行 为 ,并 且 像 美食 和 人 金钱 一 样 激 活 中 脑 多 
巴 胺 奖赏 系统 的 核心 一 一 伏 隔 核 hucleus accumbens) 
(Gold et al., 2019)。 因 此 , 大脑 高 级 皮层 对 协和 
音程 与 不 协和 音程 的 加 工 可 能 存在 着 不 同 的 认 知 
通路 。 

以 上 的 研究 表明 , 音乐 协和 性 信息 既 能 够 诱 
发 皮层 下 前 注意 水 平 的 基础 神经 反应 , 也 能 够 调 
动 高 级 水 平 的 认 知 资源 参与 ,甚至 能 够 激活 奖赏 
系统 和 影响 执行 功能 。 两 种 认 知 水 平 的 表征 均 受 
音乐 训练 影响 (Andermann et al., 2020; Bidelman 
& Heinz, 2011; Foss et al., 2007; Itoh et al., 2010; 
Minati et al., 2009; Pagés-Portabella & Toro, 2020; 
Proverbio et al., 2016), 这 说 明 , 音乐 经 验 对 音乐 
协和 性 的 知觉 加 工具 有 塑造 作用 。 未 来 研究 应 该 
探讨 不 同音 乐 文化 背景 如 何 自 上 而 下 的 调节 音乐 
协和 性 的 神经 机 制 。 


6 研究 展望 


音乐 具有 传情 达意 的 作用 ,能 够 引起 听 者 强 
烈 的 情绪 体验 。 音 乐 协和 性 是 连接 音乐 与 情绪 的 
关键 元 素 。 相 关 文 献 已 经 在 理论 观点 和 研究 方法 
上 有 了 较 大 的 突破 ,但 仍然 存在 着 许多 尚 需 解决 
的 问题 : (1) 什么 样 的 声学 特征 导致 和 声音 程 被 认 
为 是 协和 的 ? (2) 人 类 如 何 进化 出 加 工 这 些 特征 的 
能 力 ? (3) 为 什么 人 类 把 这 些 声学 特征 赋予 了 相应 
的 审美 属性 ? 


拍 频 效应 的 理论 之 争 。 然 而 ,二 者 并 非 不 可 调和 
近期 的 研究 结果 都 相继 支持 了 多 因素 混合 理论 的 
假设 , 认为 二 者 共同 决定 音乐 协和 性 知觉 (Friedman 
et al., 2021; Harrison & Pearce, 2020). 但 这 也 引发 
了 诸多 疑问 。 壁 如 ， 两 种 认 知 活动 对 音乐 协和 性 
的 影响 哪 一 个 作用 更 大 ? 二 者 引起 的 协和 性 知觉 
效果 是 否 截 然 相反 ， 即 前 者 主要 负责 引发 协和 感 ， 
后 者 主要 导致 不 协和 感 ? 最 初 的 信息 编码 形式 是 
发 生 在 神经 系统 还 是 发 生 在 基底 膜 ? 未 来 研究 应 
该 寻找 新 的 范式 分 离 这 两 个 因素 。 针 对 问题 二 ， 
语音 相似 性 假设 和 比较 心理 学 证 据 都 提供 了 较 好 
的 回答 ， 对 协和 音程 偏好 反映 了 听觉 系统 对 自然 
和 谐 泛 音 特 征 以 及 同类 嗓音 相似 性 特征 的 神经 生 
物 学 倾向 ， 但 对 不 协和 音程 排斥 的 生物 学 原因 还 
并 不 清楚 。 此 前 的 研究 表明 , 粗糙 感 极为 明显 的 
尖 叫 声音 能 够 直击 大 脑 的 恐惧 中 枢 一 一 杏仁 核 
(Arnal et al., 2015)， 人 类 很 可 能 把 厌恶 情绪 泛 化 
至 所 有 具有 明显 粗糙 感 的 声音 特征 。 未 来 研究 可 
以 分 析 不 协和 音程 在 诱发 负 性 情绪 方面 是 否 遵循 
相似 的 演化 规律 和 认 知 模式 。 问 题 三 要 比 前 两 个 
问题 更 加 复杂 ， 因 为 音乐 协和 性 知觉 是 否 在 人 类 
社会 中 普遍 存在 尚 有 争议 , 除了 受 先天 因素 约束 
外 ,经 验 塑造 及 文化 昌 陶 同样 扮演 着 重要 角色 ， 
甚至 有 人 认为 ， 人 类 根本 就 没有 进化 出 任何 音乐 
审美 能 力 ， 对 音程 的 喜爱 或 排斥 只 是 长 期 受 西方 
现代 和 声音 乐 规 范 影响 的 结果 。 一 些 未 接触 过 西 
方 音乐 文化 的 群体 就 未 表现 出 协和 性 的 审美 偏好 
(McDermott et al., 2016), 一 些 地 区 其 至 盛行 不 协 
和 的 拍 频 复 调 音 乐 (Ambrazevitius,2017; Vassilakis, 
2005)。 所 以 ， 人 类 为 何 将 一 些 声学 特征 赋予 相应 
的 审美 属性 仍然 值得 进一步 思考 。 此 外 ,中 国 传 
统 民族 音乐 具有 偏重 旋律 变化 而 轻视 和 声 作用 的 
特点 ,在 乐器 样式 、 音 乐 形 式 和 文化 内 涵 等 方面 
都 与 西方 音乐 存在 较 大 差异 。 研 究 者 可 以 基于 音 
乐 库 分 析 法 ， 考 察 中 国民 族 音乐 在 未 接触 西方 音 
乐 前 具有 怎样 的 和 声 知 觉 观念 ， 这 或 许 有 助 于 理 
解 人 类 为 何 会 形成 当前 的 和 声音 乐 审 美 特征 。 而 
且 ， 中 国 是 一 个 民族 众多 的 国家 ， 列 含 着 大 量 多 
声 部 音乐 形态 的 少数 民族 音乐 文化 ， 如 侗族 大 歌 
和 壮族 山歌 等 , 这些 多 声 部 音乐 在 音程 协和 性 的 
表现 手法 上 是 否 与 西方 和 声音 乐 存 在 着 异曲同工 
之 妙 ? 相应 的 ， 民族 文 化 又 如 何 塑造 这 些 群 体 的 


针对 问题 一 ， 最 值得 关注 的 是 泛音 和 谐 性 与 


音乐 审美 特征 ? 近期 , 由 意大利 和 尼泊尔 政府 联 
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合 开 展 的 喜马拉雅 山脉 干 城 章 嘉 峰 科 考 项 目 发 现 ， 
影响 音乐 协和 性 的 关键 因素 是 音乐 文化 惠 陶 ， 与 
海拔 高 度 、 人 口 特征 及 民族 身份 无 关 (Prete et al., 
2020)。 因 此 ， 深 入 探究 一 些 音乐 文化 较为 浓厚 的 
多 声 部 少数 民族 音乐 ， 有 利于 阐明 文化 对 音乐 协 
和 性 审美 观念 的 塑造 作用 。 

国内 对 音乐 协和 性 的 研究 主要 集中 在 史实 描 
述 、 作 品 分 析 和 审美 思辨 等 方面 , 具有 较 强 的 主 
观 性 和 个 人 风格 ,几乎 很 难 见 到 实证 性 的 文章 ， 
主要 原因 与 国内 音乐 学 与 其 它 学 科 的 交流 度 不 高 
有 关 。 相 较 之 下 ,国外 对 音乐 协和 性 的 研究 成 果 
MER, 涉及 声学 分 析 、 毕 生发 展 、 音 乐 训 练 、 
文化 经 验 以 及 动物 行为 等 多 方面 的 实证 性 考察 
结合 认 知 神经 科学 探索 音乐 协和 性 的 脑 与 认 知 
神经 机 制 ， 为 理解 音乐 的 基本 原理 提供 了 极 丰富 
的 资料 。 事 实 上， 中国 早 在 春秋 时 期 就 建立 了 与 
古 希 腊 相 似 的 简单 整数 比 的 音乐 思想 ( 陈 思 ， 陈 其 
射 , 2019; 薛 冬 艳 , 2018)。 甚 至 在 律 学 方面 ， 明代 
的 朱 载 博 率 先 利 用 自制 的 八 十 一 档 双 排 大 算盘 计 
算出 “十 二 平均 律 ” 这 比 欧洲 的 同样 成 果 早 了 近 
半 个 世纪 。 令 人 遗憾 的 是 ， 朱 载 博 的 成 果 在 当时 
未 引起 重视 ， 而 十 二 平均 律 在 西方 一 经 提出 就 
迅速 得 到 了 推广 ， 并 革新 了 乐器 制造 工艺 技术 和 
相应 的 作曲 理论 (Chow，2020; PERSE, 2017), Hr 
Vi, 现代 西方 乐器 具有 律 制 规整 ,泛音 协调 ， 音 
响 统一 的 特点 。 中 国民 族 乐 器 却 在 音响 上 个 性 鲜 
H, 声学 复杂 ， 且 缺少 低音 乐器 ,因而 不 适合 进 
行 大 规模 的 交响 合奏 。 直 至 今日 中 国民 乐 也 未 
能 够 形成 完整 的 音乐 协和 性 理论 。 我 们 应 当 正视 
这 种 差距 。 尽 管 民 乐 从 未 停止 过 交响 化 的 尝试 与 
探索 , 但 在 乐器 改革 的 热潮 下 却 出 现 了 一 些 “ 全 
盘 西 化 ”的 极端 做 法 ( 唐 朴 林 ，2010)， 当 然 也 存在 
反对 的 声音 , 认为 中 国 音乐 具有 独特 的 审美 价值 ， 
不 应 该 以 西方 的 标准 来 评价 ， 民 乐 追求 的 就 应 当 
是 曲 高 和 寡 、 高 山 流水 的 意境 。 但 是 ， 科 学 不 分 
东西 ， 西 方 交响 音乐 发 展 也 是 改革 的 结果 ,但 改 
革 的 方向 却 是 受 实证 科学 的 牵引 ， 通 过 大 量 的 心 
理 声 学 和 生理 声学 的 实证 研究 建立 了 相应 的 音乐 
协和 性 理论 ,并且 广泛 地 应 用 于 实际 创作 
(Bennett, 2018; Chan et al., 2019)。 需要 强调 的 是 ， 
本 文 只 从 音乐 协和 性 这 一 基本 听觉 音乐 现象 角 
度 指 出 科学 研究 的 必要 性 ,不 对 音乐 形式 和 艺 
术 手 法 提出 任何 看 法 。 中 西方 音乐 各 具 特 色 , 但 


多 线程 的 和 声音 乐 无 疑 是 未 来 音乐 发 展 的 必 经 
之 路 。 
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Why musical emotion can be induced by harmony? The effect and cognitive 
mechanism of musical consonance 
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Abstract: Music is an advanced activity of human cognition and one of the universal ways of emotional 
expression in life. As the core element connecting music and emotion, the rationale for simultaneous 
consonance is still unsolved. The core of this problem is how our brain possesses musical chords composed 
of several tones and why some tone combinations sound relatively pleasant (consonance) while others sound 
unpleasant (dissonance). This question has fascinated scholars since the ancient Greeks. Physicists have 
been trying to find answers to the differences between acoustic features of consonance and dissonance 
harmony. Biologists argue that consonance perception is the basic emotional experience evoked by sound 
events in the auditory system. Psychologists are more inclined to examine whether musical consonance 
perception is nature or nurture. Although musical consonance has been researched mainly using western 
theoretical perspectives, studying musical consonance in Chinese traditional music culture is urgently 
needed. 
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